1 Introducción

2 Análisis de los métodos de enriquecimiento funcional

Términos totales Términos grandes %
ORA 66 35 53.03
GSEA 1735 129 7.44
elim 171 3 1.75
weight 133 1 0.75
PC 91 34 37.36
weight01 148 3 2.03

2.1 Resultados para ORA

2.1.1 Grafo

Grafo para los 20 términos más significativos de ORA. Abrir en nueva pestaña para ver en detalle.

2.1.2 Resultados

Enrichment plot de los 30 términos más significativos de ORA

2.1.3 Enrichment plot

2.2 Resultados para GSEA

2.2.1 Grafo

Grafo de los 20 términos más significativos para GSEA a mayor color mayor significancia. Los nodos rectangulares representan uno de los 20 términos. Abrir en nueva pestaña para ver en detalle.

2.2.2 Resultados

Enrichment plot de los 30 términos más significativos de GSEA

2.2.3 Enrichment Plot

2.3 Resultados para elim

2.3.1 Grafo

Grafo de los 10 términos más significativos para elim. A mayor color mayor significancia. Los nodos rectangulares representan uno de los 10 términos.

2.3.2 Resultados

Enrichment plot de los 30 términos más significativos de elim

2.3.3 Enriquecimiento

2.4 Resultados para weight

2.4.1 Grafo

Grafo de los 10 términos más significativos para weight. A mayor color mayor significancia. Los nodos rectangulares representan uno de los 10 términos. Abrir en nueva pestaña para ver en detalle.

2.4.2 Resultados

Enrichment plot de los 30 términos más significativos de weight

2.4.3 Enrichment Plot

2.5 Resultados para PC

2.5.1 Grafo

Grafo de los 20 términos más significativos para PC A mayor color mayor significancia. Los nodos rectangulares representan uno de los 20 términos. Abrir en nueva pestaña para ver en detalle.

2.5.2 Resultados

Enrichment plot de los 30 términos más significativos de PC

2.5.3 Enrichment Plot

2.6 Resultados para weight01

2.6.1 Grafo

Grafo de los 10 términos más significativos para weight01. A mayor color mayor significancia. Los nodos rectangulares representan uno de los 10 términos. Abrir en nueva pestaña para ver en detalle.

2.6.2 Resultados

Enrichment plot de los 30 términos más significativos de weight01

2.6.3 Enrichment Plot

2.7 Comparativas generales

2.7.1 Calidad de los términos y WSC

Tamaño medio para los términos significativos detectados por cada uno de los métodos

Distribución del IC detectado por cada método

Dichos términos redundantes presentan poco enriquecimiento y por tanto no son biológicamente tan relevantes. Para lidiar con ellos podemos hacer un proceso de filtrado o filtrado doble, y siempre previamente a la clusterizarión, pues de forma inversa la clusterización se vería sesgada por dichos términos.

El paso fundamental reside en la aplicación del WSC, que basándose en el pull total de genes de interés seleccionará aquellos términos con mejor p-valor que en conjunto representen a todo el pull de genes de interés. Este algoritmo no suele tener mucha potencia si se usa de forma aislada, sin embargo, si lo empleamos como una herramienta adicional para el filtrado previo a la clusterización vamos a conseguir una mejor calidad de los clusters. Pese a ello en nuestros datos existen aún términos generales que abarcan una gran cantidad de genes, de forma que alteran el funcionamiento de WSC y pueden afectar negativamente al resultado, por ello antes de aplicar WSC es buena idea eliminar todos aquellos términos con un tamaño superior a 1000 g/t, obteniendo los siguientes resultados.

Estandar
WSC
WSC + Filtrado
Nº Términos Enriquecimiento Nº Términos Enriquecimiento Nº Términos Enriquecimiento
Fisher 66 2.38 58 2.33 25 3.17
GSEA 1735 0.85 666 1.37 549 1.41
elim 171 6.25 165 6.15 162 6.23
weight 133 6.57 127 6.46 126 6.50
PC 91 3.51 88 3.40 55 4.54
weight01 148 6.22 143 6.10 140 6.20

En la tabla superior vemos que si usamos WSC de forma aislada conseguimos descartar algunos términos para todos los métodos; principalmente GSEA que presenta una clara mejoría; sin embargo, su efecto no es muy destacable y en algunos casos incluso empeora el enriquecimiento medio. Al combinar WSC con un filtrado de los términos generales obtenemos unos mejores resultados en todos los casos, con un claro incremento de enriquecimiento en los métodos tradicionales y una sutil mejora en los métodos de control.

2.7.2 Medida PO

Utilizando el porcentaje de solapamiento (PO):

\[ (PO) = \bigg(\frac{\frac{k}{L_1}+\frac{k}{L_2}}{2}\bigg)*100 \]

Siendo k el número de términos compartidos por ambos métodos a comparar, L1 el número de términos del primer métodos y L2 los del segundo. Con ello podemos conocer cuantos términos comparten entre sí los distintos métodos.

Heatmap de las medidas PO para los 6 métodos de enriquecimiento funcional

2.7.3 Solapamiento de términos

Relación entre los términos de ORA, GSEA y PC

Relación entre los términos de elim, weight y weight01

Relación entre los 6 métodos de enriquecimiento

3 Clusterizado de los resultados

3.1 Resultados de ORA

3.1.1 Heatmaps

3.1.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.1.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.1.2 Tablas

3.1.2.1 Tabla estandar

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 1 1
5-20 términos 2 1
< 5 términos 4 9
Tamaño medio 9 6
Total 7 11

3.1.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 0 0
5-20 términos 2 2
< 5 términos 1 1
Tamaño medio 8 8
Total 3 3

3.1.3 Resultados

3.1.3.1 SE

Clusterizado mediante simplifyEnrichment para ORA

3.1.3.2 REVIGO

Clusterizado mediante REVIGO para ORA

3.1.3.3 SE - WSC

3.1.3.4 REVIGO - WSC

3.2 Resutados GSEA

3.2.1 Heatmaps

3.2.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.2.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.2.2 Tablas

3.2.2.1 Tabla estandar

Resultados del clusterizado para GSEA
simplifyEnrichment REVIGO
> 20 términos 12 27
5-20 términos 6 28
< 5 términos 27 24
Tamaño medio 38 21
Total 45 79

3.2.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 9 7
5-20 términos 17 22
< 5 términos 14 21
Tamaño medio 13 10
Total 40 50

3.2.3 Resultados

3.2.3.1 SE

Clusterizado mediante simplifyEnrichment para GSEA

3.2.3.2 REVIGO

Clusterizado mediante REVIGO para GSEA

3.2.3.3 SE - WSC

3.2.3.4 REVIGO - WSC

3.3 Resultados elim

3.3.1 Heatmaps

3.3.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.3.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.3.2 Tablas

3.3.2.1 Tabla estandar

Resultados del clusterizado para elim
simplifyEnrichment REVIGO
> 20 términos 1 1
5-20 términos 6 12
< 5 términos 10 13
Tamaño medio 10 6
Total 17 26

3.3.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 1 1
5-20 términos 6 12
< 5 términos 10 13
Tamaño medio 9 6
Total 17 26

3.3.3 Resultados

3.3.3.1 SE

Clusterizado mediante simplifyEnrichment para elim

3.3.3.2 REVIGO

Clusterizado mediante REVIGO para elim

3.3.3.3 SE - WSC

3.3.3.4 REVIGO - WSC

3.4 Resultados weight

3.4.1 Heatmaps

3.4.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.4.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.4.2 Tablas

3.4.2.1 Tabla estandar

Resultados del clusterizado para weight
simplifyEnrichment REVIGO
> 20 términos 1 0
5-20 términos 5 11
< 5 términos 7 11
Tamaño medio 10 6
Total 13 22

3.4.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 1 1
5-20 términos 5 7
< 5 términos 8 14
Tamaño medio 9 5
Total 14 22

3.4.3 Resultados

3.4.3.1 SE

Clusterizado mediante simplifyEnrichment para weight

3.4.3.2 REVIGO

Clusterizado mediante REVIGO para weight

3.4.3.3 SE - WSC

3.4.3.4 REVIGO - WSC

3.5 Resultados PC

3.5.1 Heatmaps

3.5.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.5.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.5.2 Tablas

3.5.2.1 Tabla estandar

Resultados del clusterizado para weight
simplifyEnrichment REVIGO
> 20 términos 0 0
5-20 términos 6 5
< 5 términos 21 27
Tamaño medio 3 2
Total 27 32

3.5.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 0 0
5-20 términos 2 2
< 5 términos 23 22
Tamaño medio 2 2
Total 25 24

3.5.3 Resultados

3.5.3.1 SE

Clusterizado mediante simplifyEnrichment para weight

3.5.3.2 REVIGO

Clusterizado mediante REVIGO para weight

3.5.3.3 SE - WSC

3.5.3.4 REVIGO - WSC

3.6 Resultados weight01

3.6.1 Heatmaps

3.6.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.6.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.6.2 Tablas

3.6.2.1 Tabla estandar

Resultados del clusterizado para weight01
simplifyEnrichment REVIGO
> 20 términos 1 1
5-20 términos 5 10
< 5 términos 10 13
Tamaño medio 9 6
Total 16 24

3.6.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 1 1
5-20 términos 5 9
< 5 términos 10 14
Tamaño medio 8 5
Total 16 24

3.6.3 Resultados

Clusterizado mediante simplifyEnrichment para weight01

3.6.3.1 SE

3.6.3.2 REVIGO

Clusterizado mediante REVIGO para weight01

3.6.3.3 SE - WSC

3.6.3.4 REVIGO - WSC

4 Conclusiones

4.1 Número de clusters

4.1.1 Clusterizado estandar

4.1.2 Clusterizado con WSC

4.2 Distribución de clusters

4.2.1 Clusterizado estandar

4.2.2 Clusterizado con WSC

4.3 Tabla comparativa

4.3.1 Tabla estandar

IC medio Media de clusters Media de tamaño Total términos
ORA 3.112686 9.0 7.5 66
GSEA 4.882497 62.0 29.5 1735
elim 5.884531 21.5 8.0 171
weight 6.149758 17.5 8.0 133
PC 3.157020 29.5 2.5 91
weight01 6.188851 20.0 7.5 148

4.3.2 Tabla WSC

IC medio Media de clusters Media de tamaño Total términos
ORA 4.399299 3.0 8.0 25
GSEA 4.096597 45.0 11.5 549
elim 6.094104 21.5 7.5 162
weight 6.232131 18.0 7.0 126
PC 3.867770 24.5 2.0 55
weight01 6.269204 20.0 6.5 140